Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter

23-й Форум «Информационные технологии в финсекторе»

 
 
IX Форум Auto-ID & Mobility - решения для бизнеса

Искусственный интеллект расшифрует аудиозапись в мобильном приложении VK

09.06.2020

ВКонтакте создала технологию, благодаря которой пользователям больше не придётся слушать голосовые сообщения — их можно будет прочитать



За распознавание речи отвечает новая нейросеть, созданная командой исследований ВКонтакте. В отличие от остальных, она учитывает высокую нагрузку платформы, а также русскоязычный сленг и сложные условия записи.

Функция работает в мобильном приложении VK и уже доступна части пользователей, а у всех появится в ближайшую неделю. Распознавать можно как полученные, так и отправленные голосовые сообщения длительностью до 30 секунд — это 90% от всех аудио, которые записывают при общении ВКонтакте. Более того, новая технология поможет вернуться к нужной информации в переписке: голосовые сообщения теперь можно находить при помощи поиска по тексту. В будущем функция распознавания появится в версии для компьютера, а расшифровать можно будет как более длинные, так и пересланные сообщения.

Голосовые сообщения — очень популярный формат общения ВКонтакте. Ежемесячно аудиосообщениями обмениваются 30 миллионов пользователей, поэтому новая технология VK рассчитана на самые высокие нагрузки. При этом нейросеть расшифровывает записи быстрее, чем человек, хорошо понимает разговорный язык и заимствованную лексику, а также справляется с аудио низкого качества и нечёткой речью.

Павел Калайдин, директор по исследованиям в области искусственного интеллекта ВКонтакте:
«Расшифровка аудиосообщений — уникальная и по-своему интересная задача, которая значительно отличается, например, от распознавания речи в голосовых помощниках. С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке».

Распознавание голосовых сообщений полностью автоматизировано и проводится при помощи методов искусственного интеллекта. Сотрудники ВКонтакте и любые другие сторонние лица не обладают доступом к личным сообщениям пользователей. Голосовые — не исключение. Чтобы собрать данные для обучения, участники программы VK Testers записывали специально подготовленные фразы. Также качество распознавания оценивалось с помощью обратной связи от тестировщиков.

ВКонтакте начала тестировать функцию распознавания голосовых сообщений в марте. Ранее VK представила нейросеть, генерирующую новостные заголовки, внедрила модели машинного обучения в модерацию контента и определение тематики публикаций, а также открыла в МФТИ собственную лабораторию искусственного интеллекта.

Источник:  Пресс-служба VK


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

Postek Q8
Postek Q8
Компактный настольный принтер этикеток Postek Q8
Seaory S21
Seaory S21
Настольный односторонний карточный принтер
Chainway C66
Chainway C66
Мобильный компьютер на базе OC Android
Chainway C3000 UHF RFID
Chainway C3000 UHF RFID
Ручной UHF RFID считыватель промышленного класса на базе Windows CE
Postek OX
Postek OX
Высокопроизводительные промышленные принтеры
Chainway C71 UHF RFID
Chainway C71 UHF RFID
Ручной мобильный UHF RFID считыватель под Android
Postek серия TXr
Postek серия TXr
Высокопроизводительные промышленные RFID принтеры
RST-SPEEDWARE
RST-SPEEDWARE
ПО для сбора информации со считывателей и сохранения ее в базе данных
Union EAM
Union EAM
Программная платформа для автоматизированного учета имущества по штрихкодам, NFC- и RFID-меткам

Все продукты >>>

 
IX Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Международная промышленная выставка «EXPO EURASIA KAZAKHSTAN 2024»
Вторая международная промышленная выставка «EXPO-RUSSIA IRAN 2024»

Опрос


Цифровая индустрия промышленной России - ЦИПР



Комментарии